智能论文笔记

Cloud-based user modeling for social robots: a first attempt

Marco Botta , Daniele Camilleri , Federica Cena , Francesco Di Sario , Cristina Gena , Giuseppe Ignone , Claudio Mattutino

分类：机器人

2022-09-25

社交机器人是一种自主机器人，通过参与其协作角色附带的社会情感行为，技能，能力和规则，与人们互动。为了实现这些目标，我们认为建模与用户的互动并将机器人行为调整为用户本人对其社会角色至关重要。本文提出了我们首次尝试将用户建模功能集成到社交和情感机器人中。我们提出了一种基于云的体系结构，用于建模用户机器人交互，以便使用不同类型的社交机器人重复使用该方法。

translated by 谷歌翻译

Application of the nnU-Net for automatic segmentation of lung lesion on CT images, and implication on radiomic models

Matteo Ferrante , Lisa Rinaldi , Francesca Botta , Xiaobin Hu , Andreas Dolp , Marta Minotti , Francesca De Piano , Gianluigi Funicelli , Stefania Volpe , Federica Bellerba

分类：计算机视觉

2022-09-24

病变分割是放射线工作流程的关键步骤。手动分割需要长时间的执行时间，并且容易发生可变性，从而损害了放射线研究及其鲁棒性的实现。在这项研究中，对非小细胞肺癌患者的计算机断层扫描图像进行了深入学习的自动分割方法。还评估了手动与自动分割在生存放射模型的性能中的使用。方法总共包括899名NSCLC患者（2个专有：A和B，1个公共数据集：C）。肺部病变的自动分割是通过训练先前开发的建筑NNU-NET进行的，包括2D，3D和级联方法。用骰子系数评估自动分割的质量，以手动轮廓为参考。通过从数据集A的手动和自动轮廓中提取放射性的手工制作和深度学习特征来探索自动分割对患者生存的放射素模型对患者生存的性能的影响。评估并比较模型的精度。结果通过平均2D和3D模型的预测以及应用后处理技术来提取最大连接的组件，可以实现具有骰子= 0.78 +（0.12）的自动和手动轮廓之间的最佳一致性。当使用手动或自动轮廓，手工制作或深度特征时，在生存模型的表现中未观察到统计差异。最好的分类器显示出0.65至0.78之间的精度。结论NNU-NET在自动分割肺部病变中的有希望的作用已得到证实，从而大大降低了时必的医生的工作量，而不会损害基于放射线学的生存预测模型的准确性。

translated by 谷歌翻译

Enhanced Fairness Testing via Generating Effective Initial Individual Discriminatory Instances

Minghua Ma , Zhao Tian , Max Hort , Federica Sarro , Hongyu Zhang , Qingwei Lin , Dongmei Zhang

分类：机器学习

2022-09-17

公平测试旨在减轻数据驱动的AI系统决策过程中的意外歧视。当AI模型为仅根据受保护属性（例如年龄和种族）区分的两个不同的个体做出不同的决定时，可能会发生个人歧视。这样的实例揭示了偏见的AI行为，被称为个人歧视实例（IDI）。在本文中，我们提出了一种选择初始种子以生成IDI进行公平测试的方法。先前的研究主要使用随机的初始种子来实现这一目标。但是，这个阶段至关重要，因为这些种子是后续IDIS生成的基础。我们称我们提出的种子选择方法I＆D。它产生了大量的初始IDI，表现出极大的多样性，旨在提高公平测试的整体性能。我们的实证研究表明，I＆D能够就四种最先进的种子生成方法产生更多的IDI，平均产生1.68倍的IDI。此外，我们比较I＆D在训练机器学习模型中的使用，并发现与最先进的ART相比，使用I＆D将剩余IDI的数量减少了29％，因此表明I＆D有效地改善了模型公平性

translated by 谷歌翻译

Genie: A new, fast, and outlier-resistant hierarchical clustering algorithm

Marek Gagolewski , Maciej Bartoszuk , Anna Cena

分类：机器学习 | (统计)机器学习

2022-09-13

应用分层聚类算法所需的时间最常由成对差异度量的计算数量主导。对于较大的数据集，这种约束使所有经典链接标准的使用都处于不利地位。但是，众所周知，单个连锁聚类算法对离群值非常敏感，产生高度偏斜的树状图，因此通常不会反映出真正的潜在数据结构 - 除非簇分离良好。为了克服其局限性，我们提出了一个名为Genie的新的分层聚类链接标准。也就是说，我们的算法将两个簇链接在一起，以至于选择的经济不平等度量（例如，gini-或bonferroni index）的群集大小不会大大增加超过给定阈值。提出的基准表明引入的方法具有很高的实际实用性：它通常优于病房或平均链接的聚类质量，同时保持单个连锁的速度。 Genie算法很容易平行，因此可以在多个线程上运行以进一步加快其执行。它的内存开销很小：无需预先计算完整的距离矩阵即可执行计算以获得所需的群集。它可以应用于配备有差异度量的任意空间，例如，在实际矢量，DNA或蛋白质序列，图像，排名，信息图数据等上。有关R。另请参见https://genieclust.gagolewski.com有关新的实施（GenieClust） - 可用于R和Python。

translated by 谷歌翻译

Spotting Virus from Satellites: Modeling the Circulation of West Nile Virus Through Graph Neural Networks

Lorenzo Bonicelli , Angelo Porrello , Stefano Vincenzi , Carla Ippoliti , Federica Iapaolo , Annamaria Conte , Simone Calderara

分类：计算机视觉 | 人工智能 | 机器学习

2022-09-07

西尼罗河病毒（WNV）的发生代表了最常见的蚊子传播的人畜共患病毒感染之一。它的循环通常与适合载体增殖和病毒复制的气候和环境条件有关。最重要的是，已经开发了几种统计模型来塑造和预测WNV循环：尤其是，最近的地球观察数据（EO）数据的巨大可用性，再加上人工智能领域的持续发展，提供了宝贵的机会。在本文中，我们试图通过用卫星图像为深度神经网络（DNN）喂食WNV循环，这些图像已被广泛证明可以具有环境和气候特征。值得注意的是，尽管以前的方法可以独立分析每个地理位置，但我们提出了一种空间感知方法，该方法也考虑了近距离位点的特征。具体而言，我们建立在图形神经网络（GNN）的基础上，以从相邻位置进行聚集特征，并进一步扩展这些模块以考虑多个关系，例如两个地点之间的温度和土壤水分差异以及地理距离。此外，我们将与时间相关的信息直接注入模型中，以考虑病毒传播的季节性。我们设计了一个实验环境，将卫星图像（来自Landsat和Sentinel任务）结合在一起，以及意大利WNV循环的地面真相观察。我们表明，与适当的预训练阶段配对时，我们提出的多种jaCencenciencencencence Graph注意网络（MAGAT）始终导致更高的性能。最后，我们在消融研究中评估MAGAT每个组成部分的重要性。

translated by 谷歌翻译

Non-Line-of-Sight Tracking and Mapping with an Active Corner Camera

Sheila Seidel , Hoover Rueda-Chacon , Iris Cusini , Federica Villa , Franco Zappa , Christopher Yu , Vivek K Goyal

分类：计算机视觉

2022-08-02

在各种领域，包括搜索和救援，自动驾驶汽车导航和侦察的各个领域，形成不断变化的场景的非线图像（NLOS）图像的能力可能具有变革性。大多数现有的活性NLOS方法使用针对继电器表面并收集回返回光的时间分辨测量的脉冲激光来照亮隐藏场景。流行的方法包括对垂直壁上的矩形网格的栅格扫描，相对于感兴趣的数量，以产生共聚焦测量集合。这些固有地受到激光扫描的需求的限制。避免激光扫描的方法将隐藏场景的运动部件作为一个或两个点目标。在这项工作中，基于更完整的光学响应建模，但仍没有多个照明位置，我们演示了运动中对象的准确重建和背后的固定风景的“地图”。计数，本地化和表征运动中隐藏物体的大小，结合固定隐藏场景的映射的能力，可以大大提高各种应用中的室内情况意识。

translated by 谷歌翻译

Are Cluster Validity Measures (In)valid?

Marek Gagolewski , Maciej Bartoszuk , Anna Cena

分类： (统计)机器学习 | 机器学习

2022-08-02

内部群集有效性度量（例如Calinski-Harabasz，Dunn或Davies-Bouldin指数）经常用于选择适当数量的分区数量，应将数据集分为二。在本文中，我们考虑如果将这些索引视为无监督学习活动中的客观功能会发生什么。关于轮廓指数的最佳分组是否真的有意义？事实证明，许多群集有效性指数促进了聚类，这些聚类与专家知识相匹配。我们还引入了邓恩指数的一个新的，表现出色的变体，该变体是建立在OWA操作员和接近邻居图的基础上的，因此，无论其形状如何，都可以更好地相互分离。

translated by 谷歌翻译

Multimodal Emotion Recognition with Modality-Pairwise Unsupervised Contrastive Loss

Riccardo Franceschini , Enrico Fini , Cigdem Beyan , Alessandro Conti , Federica Arrigoni , Elisa Ricci

分类：计算机视觉 | 人工智能 | 机器学习

2022-07-23

情绪识别涉及几个现实世界应用。随着可用方式的增加，对情绪的自动理解正在更准确地进行。多模式情感识别（MER）的成功主要依赖于监督的学习范式。但是，数据注释昂贵，耗时，并且由于情绪表达和感知取决于几个因素（例如，年龄，性别，文化），获得具有高可靠性的标签很难。由这些动机，我们专注于MER的无监督功能学习。我们考虑使用离散的情绪，并用作模式文本，音频和视觉。我们的方法是基于成对方式之间的对比损失，是MER文献中的第一次尝试。与现有的MER方法相比，我们的端到端特征学习方法具有几种差异（和优势）：i）无监督，因此学习缺乏数据标记成本； ii）它不需要数据空间增强，模态对准，大量批量大小或时期； iii）它仅在推理时应用数据融合； iv）它不需要对情绪识别任务进行预训练的骨干。基准数据集上的实验表明，我们的方法优于MER中应用的几种基线方法和无监督的学习方法。特别是，它甚至超过了一些有监督的MER最先进的。

translated by 谷歌翻译

Bia Mitigation for Machine Learning Classifiers: A Comprehensive Survey

Max Hort , Zhenpeng Chen , Jie M. Zhang , Federica Sarro , Mark Harman

分类：机器学习

2022-07-14

本文提供了有关在机器学习（ML）模型中实现公平性的偏置缓解方法的全面调查。我们总共收集了234个有关ML分类器偏置缓解的出版物。这些方法可以根据其干预程序（即预处理，进行内部处理，后处理）及其应用的技术来区分。我们研究了文献中如何评估现有的缓解方法。特别是，我们考虑数据集，指标和基准测试。根据收集的见解（例如，最受欢迎的公平度量是什么？用于评估偏置缓解方法的数据集？）。我们希望在开发和评估新的缓解方法时支持从业者做出明智的选择。

translated by 谷歌翻译

A Comprehensive Empirical Study of Bias Mitigation Methods for Software Fairness

Zhenpeng Chen , Jie M. Zhang , Federica Sarro , Mark Harman

分类：人工智能

2022-07-07

软件偏见是软件工程师越来越重要的操作问题。我们提出了17种代表性缓解方法的大规模，全面的经验评估，该方法通过12个机器学习（ML）绩效指标，4项公平度量指标和24种类型的公平性 - 性能权衡评估，应用于8种广泛采用的公平性折衷评估基准软件决策/预测任务。与以前在此重要的操作软件特征上的工作相比，经验覆盖范围是全面的，涵盖了最多的偏见缓解方法，评估指标和公平性的绩效权衡措施。我们发现（1）偏置缓解方法大大降低了所有ML性能指标（包括先前工作中未考虑的指标）所报告的值，在很大一部分的情况下（根据不同的ML性能指标为42％〜75％） ; （2）在所有情况和指标中，偏置缓解方法仅在约50％的情况下获得公平性改善（根据用于评估偏见/公平性的指标，介于29％〜59％之间）；（3）缓解偏见的方法的表现不佳，甚至导致37％的情况下的公平性和ML性能下降；（4）缓解偏差方法的有效性取决于任务，模型，公平性和ML性能指标，并且没有证明对所有研究的情况有效的“银弹”缓解方法。在仅29％的方案中，我们发现优于其他方法的最佳缓解方法。我们已公开提供本研究中使用的脚本和数据，以便将来复制和扩展我们的工作。

translated by 谷歌翻译